1
Анализ связи на диаграмме рассеяния: фундаментальное различие между корреляцией и функциональной зависимостью
MATH1003SA-PEP-CNLesson 3
00:00
Определённость (функциональная зависимость)rПлощадь круга $S = \pi r^2$Неопределённость (корреляция)Рост детей против роста отцов
В мире математики существуют отношения, которые являются «абсолютными», например, когда радиус окружности определён, площадь автоматически становится фиксированной. Однако в реальной жизни большинство отношений являются «неоднозначными»: если отец выше, то его сын, как правило, тоже выше, но эта связь не является однозначной. Именно это и составляет сутькорреляциипривлекательность. Она описывает наличие некоторого тренда между переменными, при этом допуская случайные колебания. Диаграмма рассеяния — это «микроскоп», способный выявить эти скрытые тенденции.

Основные концепции: различение

Корреляция (Correlation) подразумевает неопределённую связь между переменными. Когда значение одной переменной определено, значение другой переменной остаётся случайным. В то время как функциональная зависимость является определённой, где $y$ полностью определяется $x$.

Наблюдая диаграмму рассеяния (Scatter Plot), мы можем непосредственно оценить связь между переменными:

  • Прямая корреляция (Positive): в целом наблюдается «восходящий тренд вправо», при увеличении $x$ значение $y$ стремится возрастать.
  • Обратная корреляция (Negative): 整体呈“右下挫”,$x$ 增大时 $y$ 趋于减小。
  • Линейная корреляция: точки плотно расположены около прямой линии.
Корреляция не означает причинно-следственную связь! Даже если диаграмма рассеяния показывает сильную корреляцию, это может быть вызвано общим фактором или чистой случайностью. Перед тем как делать выводы, научное логическое обоснование важнее визуального анализа графиков.